Nanopartículas revestidas com sensores moleculares poderiam ser usadas para desenvolver testes caseiros para diversos tipos de câncer.

Nanopartículas revestidas com peptídeos gerados por IA podem atuar como sensores que sinalizam a presença de proteases associadas ao câncer no organismo. Créditos: Imagem: MIT News
A detecção precoce do câncer pode reduzir drasticamente as mortes por essa doença, pois os cânceres costumam ser mais fáceis de tratar quando diagnosticados no início. Para ajudar a alcançar esse objetivo, pesquisadores do MIT e da Microsoft estão usando inteligência artificial para desenvolver sensores moleculares para detecção precoce.
Os pesquisadores desenvolveram um modelo de IA para projetar peptídeos (proteínas curtas) que são alvos de enzimas chamadas proteases, que são hiperativas em células cancerígenas. Nanopartículas revestidas com esses peptídeos podem funcionar como sensores que emitem um sinal caso proteases associadas ao câncer estejam presentes em qualquer parte do corpo.
Dependendo das proteases detectadas, os médicos poderão diagnosticar o tipo específico de câncer presente. Esses sinais podem ser detectados por meio de um simples exame de urina, que pode até ser feito em casa.
“Estamos focados na detecção ultrassensível em doenças como os estágios iniciais do câncer, quando a carga tumoral é pequena, ou no início da recorrência após a cirurgia”, diz Sangeeta Bhatia, professora titular da Cátedra John e Dorothy Wilson de Ciências e Tecnologia da Saúde e de Engenharia Elétrica e Ciência da Computação no MIT, e membro do Instituto Koch de Pesquisa Integrativa do Câncer e do Instituto de Engenharia Médica e Ciência (IMES) do MIT.
Bhatia e Ava Amini '16, pesquisadora principal da Microsoft Research e ex-aluna de pós-graduação no laboratório de Bhatia, são os autores seniores do estudo, publicado hoje na Nature Communications . Carmen Martin-Alonso PhD '23, cientista fundadora da Amplifyer Bio, e Sarah Alamdari, cientista aplicada sênior da Microsoft Research, são as autoras principais do artigo.
Amplificando os sinais do câncer
Há mais de uma década, o laboratório de Bhatia teve a ideia de usar a atividade da protease como um marcador de câncer em estágio inicial. O genoma humano codifica cerca de 600 proteases, que são enzimas capazes de clivar outras proteínas, incluindo proteínas estruturais como o colágeno. Elas costumam ser hiperativas em células cancerígenas, pois ajudam as células a escapar de suas localizações originais, clivando proteínas da matriz extracelular, que normalmente mantém as células em seus lugares.
A ideia dos pesquisadores era revestir nanopartículas com peptídeos que podem ser clivados por uma protease específica. Essas partículas poderiam então ser ingeridas ou inaladas. Ao percorrerem o corpo, se encontrassem alguma protease associada ao câncer, os peptídeos nas partículas seriam clivados.
Esses peptídeos seriam secretados na urina, onde poderiam ser detectados usando uma tira de papel semelhante a um teste de gravidez. A medição desses sinais revelaria a hiperatividade de proteases em regiões profundas do corpo.
“Temos defendido a ideia de que, se for possível criar um sensor a partir dessas proteases e multiplexá-las, poderemos encontrar indícios de onde essas proteases estavam ativas em doenças. E como a clivagem do peptídeo é um processo enzimático, ela pode realmente amplificar um sinal”, diz Bhatia.
Os pesquisadores utilizaram essa abordagem para demonstrar sensores de diagnóstico para câncer de pulmão, ovário e cólon .
No entanto, nesses estudos, os pesquisadores usaram um processo de tentativa e erro para identificar peptídeos que seriam clivados por determinadas proteases. Na maioria dos casos, os peptídeos identificados podiam ser clivados por mais de uma protease, o que significava que os sinais lidos não podiam ser atribuídos a uma enzima específica.
No entanto, o uso de conjuntos "multiplexados" de muitos peptídeos diferentes produziu assinaturas de sensores distintas que foram diagnósticas em modelos animais de muitos tipos diferentes de câncer, mesmo que a identidade precisa das proteases responsáveis pela clivagem permanecesse desconhecida.
Em seu novo estudo, os pesquisadores foram além do processo tradicional de tentativa e erro, desenvolvendo um novo sistema de IA, chamado CleaveNet, para projetar sequências peptídicas que pudessem ser clivadas de forma eficiente e específica por proteases-alvo de interesse.
Os usuários podem fornecer critérios de design ao CleaveNet, e o CleaveNet gerará peptídeos candidatos que provavelmente se encaixam nesses critérios. Dessa forma, o CleaveNet permite que os usuários ajustem a eficiência e a especificidade dos peptídeos gerados pelo modelo, abrindo caminho para aprimorar o poder de diagnóstico dos sensores.
“Se soubermos que uma determinada protease é fundamental para um certo tipo de câncer e pudermos otimizar o sensor para que seja altamente sensível e específico para essa protease, isso nos dará um excelente sinal de diagnóstico”, diz Amini. “Podemos aproveitar o poder da computação para tentar otimizar especificamente essas métricas de eficiência e seletividade.”
Para um peptídeo que contém 10 aminoácidos, existem cerca de 10 trilhões de combinações possíveis. O uso de IA para pesquisar esse imenso espaço permite a previsão, o teste e a identificação de sequências úteis muito mais rapidamente do que os humanos seriam capazes, além de reduzir consideravelmente os custos experimentais.
Previsão da atividade enzimática
Para criar o CleaveNet, os pesquisadores desenvolveram um modelo de linguagem proteica para prever as sequências de aminoácidos de peptídeos, de forma análoga a como grandes modelos de linguagem podem prever sequências de texto. Para os dados de treinamento, eles usaram dados disponíveis publicamente sobre cerca de 20.000 peptídeos e suas interações com diferentes proteases de uma família conhecida como metaloproteinases da matriz (MMPs).
Utilizando esses dados, os pesquisadores treinaram um modelo para gerar sequências peptídicas que, segundo as previsões, seriam clivadas por proteases. Essas sequências poderiam então ser inseridas em outro modelo que previa a eficiência com que cada peptídeo seria clivado por qualquer protease de interesse.
Para demonstrar essa abordagem, os pesquisadores se concentraram em uma protease chamada MMP13, que as células cancerígenas usam para cortar o colágeno e se disseminar a partir de seus locais de origem. Ao utilizar a MMP13 como alvo no CleaveNet, os modelos puderam projetar peptídeos que poderiam ser clivados pela MMP13 com considerável seletividade e eficiência. Esse perfil de clivagem é particularmente útil para aplicações diagnósticas e terapêuticas.
“Quando configuramos o modelo para gerar sequências que fossem eficientes e seletivas para MMP13, ele na verdade gerou peptídeos que nunca haviam sido observados no treinamento, e ainda assim essas novas sequências se mostraram eficientes e seletivas”, diz Martin-Alonso. “Foi muito empolgante ver isso.”
Segundo os pesquisadores, esse tipo de seletividade pode ajudar a reduzir o número de peptídeos diferentes necessários para diagnosticar um determinado tipo de câncer, identificar novos biomarcadores e fornecer informações sobre vias biológicas específicas para estudo e testes terapêuticos.
O laboratório de Bhatia faz parte atualmente de um projeto financiado pela ARPA-H para criar marcadores para um kit de diagnóstico domiciliar que poderia potencialmente detectar e distinguir 30 tipos diferentes de câncer, em estágios iniciais da doença, com base em medições da atividade de proteases. Esses sensores poderiam incluir a detecção não apenas da clivagem mediada por MMP, mas também de outras enzimas, como serina proteases e cisteína proteases.
Peptídeos projetados usando o CleaveNet também podem ser incorporados em terapias contra o câncer, como tratamentos com anticorpos. O uso de um peptídeo específico para ligar um agente terapêutico, como uma citocina ou um fármaco de molécula pequena, a um anticorpo direcionado pode permitir que o medicamento seja liberado somente quando os peptídeos forem expostos a proteases no ambiente tumoral, melhorando a eficácia e reduzindo os efeitos colaterais.
Além das aplicações diretas em diagnósticos e terapêuticas, a combinação dos esforços do projeto ARPA-H com essa estrutura de modelagem poderia viabilizar a criação de um abrangente “atlas de atividade de proteases” que englobe múltiplas classes de proteases e tipos de câncer. Tal recurso poderia acelerar ainda mais a pesquisa em detecção precoce do câncer, biologia de proteases e modelos de IA para o design de peptídeos.
A pesquisa foi financiada pela Fundação La Caixa, pelo Centro Ludwig do MIT e pelo Centro Marble de Nanomedicina do Câncer.